بهسازی گفتار با استفاده از گذرای سیگنال

thesis
abstract

در دهه های گذشته تحقیقات گسترده ای برای بهبود فهم گفتار نویزی انجام شده است. این تحقیقات می تواند به 2 گروه تقسیم شود :روش های کاهش نویز و بهبود گفتار یا مقاوم سازی گفتار. گروه اول شامل تکنیک هایی است که نویز ترکیب شده با گفتار را با کمترین تاثیر روی فهم گفتار کاهش می دهد. این روش ها در شرایطی که ماهیت نویز نامعلوم باشد به خوبی کار نمی کنند. این گروه از روش های بهسازی سیگنال گفتار، روش کاهش نویز یا حذف نویز نامیده می شوند. در گروه دوم از روش های بهسازی گفتار، با فرض در دسترس بودن سیگنال تمیز، بگونه ای عمل می شود که قابلیت فهم گفتار تمیز قبل از تضعیف سیگنال در اثر نویز افزایش داده شود. در این روش ها ابتدا مولفه های گذرا در سیگنال گفتار را مشخص نموده و سپس با تقویت آن ها و ترکیب مجدد با سیگنال اصلی، سیگنال بهسازی شده حاصل می شود. از جمله کاربردهای این روش در ارتباطات رادیویی را می توان، ارتباط های بی سیم یا گفتگوهای برج مراقبت فرودگاه که فهم گفتار دریافتی بسیار مهم تر از کیفیت گفتار است اشاره کرد.تمرکز این پایانامه بر روی روش دوم یا بهبود گفتار است. در این رساله روش های افزایش قابلیت فهم گفتار بررسی گردیده و سپس با استفاده از تبدیل بسته موجک روش جدیدی ارائه می شود. روش های موجود، قابلیت فهم گفتار را نسبت به سیگنال اصلی در سیگنال به نویزهای مختلف افزایش دادند ولی عمده معایب آن، قابل اجرا نبودن در زمان های کم یا بلادرنگ نبودن الگوریتم ها است که هر کدام از این روش ها دارای پیچیدگی های محاسباتی خاص خود هستند. به همین منظور باید روشی پیشنهاد می شد که علاوه بر افزایش فهم گفتار، بتواند سیگنال گفتار را در زمان کم پردازش کند. روش پیشنهادی بر اساس تبدیل بسته موجک و به دو بخش تقسیم می شود. در بخش اول برای کاهش پردازش، پاکت های تبدیل موجک با استفاده از الگوریتم k-means و واریانس انرژی آن ها به سه کلاس تقسیم می شوند و در بخش دوم با استفاده از انرژی غیرخطی و آستانه تطبیقی، مولفه گذرای هرکلاس بدست می آید . با تقویت مولفه های گذرا و باز ترکیب آن با سیگنال اصلی، قابلیت فهم سیگنال گفتار افزایش می یابد. قابلیت فهم سیگنال اصلی و بهسازی شده توسط 20 فرد شنونده مورد ارزیابی قرار گرفته است. نتایج آزمون ارزیابی نشان می دهد که قابلیت فهم گفتار بهسازی شده بطور چشمگیری نسبت به سیگنال اصلی افزایش یافته است. ( بیشترین بهبود در سیگنال به نویزdb 20- با 22درصد افزایش و کمترین در سیگنال به نویز db0 با 11 درصد افزایش). از مزایای روش پیشنهادی کاهش زمان پردازش است که نسبت به روش های پیشین در زمان کمتری پردازش انجام می شود.

First 15 pages

Signup for downloading 15 first pages

Already have an account?login

similar resources

بهسازی وفقی سیگنال گفتار در محیط‌های واقعی با استفاده از ساختار ترکیبی مبتنی بر شکل‌دهنده‌های پرتو و فیلتر پسینه

تنوع میدان‌های نویزی حاکم بر محیط‌های واقعی، طراحی سیستم واحدی را که قادر به حذف کامل همه اغتشاشات محیطی باشد، با مشکل مواجه می‌کند. لذا، داشتن یک شناخت اولیه از میدان‌های نویزی موجود در محیط و بررسی نوع اثر هر یک بر روی سیگنال گفتار، گام مؤثری در جهت فرآیند بهسازی محسوب می‌شود. در این مقاله، ضمن بررسی نویزهای اساسی موجود در زمینه گفتار ضبط‌شده در شرایط واقعی، به ارزیابی میدان‌های نویزی پایین‌گ...

full text

بهسازی چندکاناله سیگنال گفتار با استفاده از روش های مبتنی بر تخمین در حوزه فرکانس

با توجه به کاربرد روزافزون سیستم های گفتاری در زندگی امروزی و وجود عوامل مخرب محیطی از جمله نویز، بهسازی گفتار از اهمیت زیادی برخوردار است. برای بهسازی گفتار روش های مختلفی وجود دارد که برخی مبتنی بر تخمین در حوزه زمان و برخی مبتنی بر تخمین در حوزه فرکانس هستند. روش های بهسازی گفتار را می توان به انواع روش های تک کاناله، آرایه میکروفونی و میکروفون های توزیع شده تقسیم کرد. ساختار میکروفونی توزیع...

بهسازی گفتار با استفاده از ویونت

بهسازی گفتار یا speech enhancement بیانگر گروه بزرگی از روش هاست که با انجام پردازش هایی روی سیگنال های نویزی، نهایتا منجر به بهبود کیفیت و قابلیت فهم گفتار می شود. تاکنون چندین روش در زمینه بهسازی گفتار نویزی ارائه شده است. روش پیشنهادی ما در این پایان نامه، شبکه عصبی موجک (ویونت) می باشد. این روش، مدلی مبتنی بر تلفیق شبکه عصبی با تبدیل موجک می باشد و به عنوان جایگزین مناسب در شبکه های عصبی ...

بهسازی گفتار تک‌کاناله با استفاده از ترکیب مدل قطعی نمایی و مدل تصادفی t Location-Scale

بیشتر روش‌های بهسازی گفتار، تخمینگری کاملاً متکی به مدل تصادفی گفتار ارائه می‌دهند. در این مقاله، یک تخمینگر کمترین میانگین مربعات خطا تحت یک مدل قطعی - تصادفی پیشنهاد می‌شود که در آن از یک توزیع دنباله - سنگین به نام(tls)  t location-scale برای مدل‌کردن ضرایب تبدیل فوریه گسسته گفتار تمیز و از مدل نمایی و سینوسی به‌عنوان مدل قطعی استفاده شده است. در مدل نمایی به‌کاررفته، تخمین ...

full text

تشخیص جنسیت با استفاده از سیگنال گفتار

تشخیص جنسیت با استفاده از سیگنال گفتار احمد عطاران چکیده: طبقه بندیجنسیت درگفتار و بازشناسی گوینده به اندازه طبقه بندی احساسات گفتار مفید است زیرا هنگامی که مدلهای صوتی(آکوستیک) جداگانه برای مردان و زنان به کارگرفته شود کارایی بهتری خواهد داشت. با توجه به اینکه سکوت بین زن و مرد مشترک است بنا بر این سکوت از ابتدا حذف می گردد. این امر باعث کاهش حجم بار محاسباتی اضافی و همچنین افزای...

تشخیص احساسات از سیگنال های گفتار براساس روش های فیلتر

گفتار ابزار اولیه ارتباط بین انسان‌‌ می‌باشد. با افزایش تراکنش میان انسان و ماشین نیاز به محاوره خودکار این دو و حذف کاربر انسانی مورد توجه قرار گرفته است.هدف از انجام این تحقیق، تعیین یک مجموعه از ویژگی‌های تاثیر گذار در تشخیص احساسات مبتنی بر سیگنال صحبت می‌باشد. در این مقاله، سیستمی طراحی گردید که شامل سه بخش اصلی، استخراج ویژگی، انتخاب ویژگی و طبقه‌بندی می‌باشد. پس از استخراج ویژگی‌های پرکا...

full text

My Resources

Save resource for easier access later

Save to my library Already added to my library

{@ msg_add @}


document type: thesis

وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی (نوشیروانی) بابل - دانشکده برق و کامپیوتر

Hosted on Doprax cloud platform doprax.com

copyright © 2015-2023